Wprowadzenie do teorii dystrybucji
Chociaż teoria dystrybucji jest działem matematyki abstrakcyjnej, dostarcza ona ścisłych uzasadnień dla wielu manipulacji formalnych stosowanych w naukach przyrodniczych i w literaturze technicznej. Ponadto dostarcza ona możliwości dalszego rozwoju klasycznych dyscyplin matematycznych, np. równań różniczkowych zwyczajnych i cząstkowych, rachunku operacyjnego, teorii transformacji. Pewne rodzaje dystrybucji (np. funkcja delta i jej pochodne) używane były w naukach fizycznych i technicznych już w XIX wieku, znacznie przed pojawieniem się teorii dystrybucji, która została zaproponowana w latach trzydziestych zeszłego stulecia przez L.S. Sobolewa. Zwykle stosowane dzisiaj ujęcie tej teorii należy do L. Schwartza, który sfomułował je w latach pięćdziesiątych zeszłego stulecia.
Rozważmy punkt materialny o masie \( \hskip 0.3pc m\hskip 0.3pc \) poruszający się po linii prostej z prędkością jednostajną. Przypuśćmy, że w chwili \( \hskip 0.3pc t_0\hskip 0.3pc \) punkt napotkał przeszkodę i w wyniku kolizji zmienił kierunek ruchu w stronę przeciwną. Zgodnie z prawami mechaniki powinna zachodzić zależność
gdzie \( \hskip 0.3pc v_1\hskip 0.3pc \) i \( \hskip 0.3pc v_2\hskip 0.3pc \) są prędkościami w chwili \( \hskip 0.3pc t_1\hskip 0.3pc \) i \( \hskip 0.3pc t_2\hskip 0.3pc \), a \( \hskip 0.3pc F(t)\hskip 0.3pc \) oznacza siłę działającą na punkt materialny w chwili \( \hskip 0.3pc t.\hskip 0.3pc \) Przyjmijmy, że \( \hskip 0.3pc F(t)=0\hskip 0.3pc \) dla \( \hskip 0.3pc t \neq t_0\hskip 0.3pc \). Zauważmy, że jeśli \( \hskip 0.3pc t_1<t_2<t_0,\hskip 0.3pc \) to \( \hskip 0.3pc v_2=v_1,\hskip 0.3pc \) a zatem równość ( 1 ) jest spełniona. Podobnie, gdy \( \hskip 0.3pc t_0<t_1<t_2.\hskip 0.3pc \) Jeśli natomiast \( \hskip 0.3pc t_1<t_0<t_2,\hskip 0.3pc \) wówczas \( \hskip 0.3pc v_2=-v_1.\hskip 0.3pc \) W konsekwencji lewa strona warunku ( 1 ) wynosi \( \hskip 0.3pc 2mv_2\hskip 0.3pc \), zaś prawa strona jest równa zeru. Oznacza to, że w tym przypadku warunek ( 1 ) nie jest spełniony. Powstaje naturalne pytanie: jak sformułować matematyczny opis obserwowanego zjawiska aby równość ( 1 ) była zawsze zachowana. Niestety, w zakresie klasycznego rachunku całkowego jest to niemożliwe, bowiem zarówno całka Riemanna jak i całka Lebesgue'a z funkcji równej zeru poza jednym punktem jest równa zeru. Oznacza to, że za pomocą wymienionych całek nie jesteśmy w stanie opisać zjawisk impulsowych. Z drugiej strony zjawiska impulsowe w fizyce występują w sposób naturalny. Wystarczy wyobrazić sobie ruch cząsteczek gazu. Każda kolizja cząstek powoduje impulsowe przekazanie energii. Powstaje więc naturalna potrzeba stworzenia aparatu matematycznego zdolnego opisywać takie zjawiska.
Przed wprowadzeniem formalnych pojęć pozwalających opisać reakcje impulsowe spróbujmy działania impulsowe opisać za pomocą procesu granicznego. Dla \( \hskip 0.3pc n \in \mathbb N\hskip 0.3pc \) połóżmy
Przy \( \hskip 0.3pc n\to \infty\hskip 0.3pc \) ciąg funkcji \( \hskip 0.3pc \{\varphi_n\}\hskip 0.3pc \) jest punktowo zbieżny do funkcji
Dla dowolnego \( \hskip 0.3pc n \in \mathbb N\hskip 0.3pc \) całka z funkcji \( \hskip 0.3pc \varphi_n\hskip 0.3pc \) po zbiorze \( \hskip 0.3pc \mathbb R\hskip 0.3pc \) jest równa \( \hskip 0.3pc 1,\hskip 0.3pc \) natomiast całka Lebesgue'a z funkcji \( \hskip 0.3pc \varphi_0\hskip 0.3pc \) jest równa zero. Oznacza to, że całki z funkcji \( \hskip 0.3pc \varphi_n\hskip 0.3pc \) nie są zbieżne do całki z funkcji granicznej \( \hskip 0.3pc \varphi_0\hskip 0.3pc \), tak więc, za pomocą opisanego procesu granicznego nie uzyskamy równości ( 1 ).
Aby opisać przedstawioną powyżej sytuacje reakcji impulsowych już w XIX wieku fizycy wprowadzili pojęcie tzw. delty Diraca \( \hskip 0.3pc \delta.\hskip 0.3pc \) Jest to obiekt który posiada następującą własność. Dla dowolnej funkcji \( \hskip 0.3pc f:\mathbb R \to \mathbb R\hskip 0.3pc \) zachodzi
Oczywistym jest, że tak wprowadzony obiekt nie jest funkcją w sensie klasycznym, bowiem wartość całki zależy tylko od wartości funkcji w punkcie \( \hskip 0.3pc 0\hskip 0.3pc \) (Należy zaznaczyć, że użycie symbolu całki jest tutaj pewnym nadużyciem, bowiem zarówno całka Riemanna jak i całka Lebesgue'a były zdefiniowane tylko dla stosownych klas funkcji, natomiast w powyższym zapisie symbol ten odnosi się do zupełnie innych obiektów, które nie zostały jeszcze zdefiniowane). Niemniej przyjmując powyższą konwencje mamy
oraz
Nietrudno sprawdzić, że jeśli ciąg \( \hskip 0.3pc \{\varphi_n\}\hskip 0.3pc \) jest dany wzorem ( 2 ) to
a zatem pożądane przejście graniczne zostało zachowane.
Ciąg funkcji \( \hskip 0.3pc \{\varphi_n\}\hskip 0.3pc \) nazywamy ciągiem tworzącym dla delty Diraca. Zauważmy, że dla delty Diraca można skonstruować ciągi tworzące których wyrazami są funkcje klasy \( \hskip 0.3pc C^{\infty}\hskip 0.3pc \) o nośnikach zwartych. Rozważmy np. ciąg
Oczywiście \( \hskip 0.3pc \psi_n \in C^{\infty}(\mathbb R),\hskip 0.3pc \) \( \hskip 0.3pc n=1,2,\ldots. \hskip 0.3pc \) Widać też natychmiast, że ciąg \( \hskip 0.3pc \{\psi_n\}\hskip 0.3pc \) jest zbieżny punktowo do funkcji \( \hskip 0.3pc \varphi_0\hskip 0.3pc \) danej wzorem ( 3 ). Ponadto, dla dowolnego \( \hskip 0.3pc n \in \mathbb N\hskip 0.3pc \) całka z funkcji \( \hskip 0.3pc \psi_n\hskip 0.3pc \) jest równa \( \hskip 0.3pc 1.\hskip 0.3pc \) Oznacza to, że nawet dla tak regularnych funkcji \( \hskip 0.3pc \psi_n \hskip 0.3pc \) ciąg całek z tych funkcji nie jest zbieżny do całki z funkcji granicznej. Fakt ten praktycznie przekreśla nadzieje na przeprowadzanie rozsądnych analiz w zakresie pojęć analizy klasycznej. Aby usunąć tę trudność zbudowaną tzw. teorię funkcji uogólnionych, zwaną też teorią dystrybucji. Standartowym przykładem dystrybucji jest wspomniana wyżej delta Diraca.
Przed formalnym wprowadzeniem pojęcia dystrybucji przypomnijmy pewne fakty z teorii funkcji i całki, które w naszych rozważaniach będą istotne. Niech \( \hskip 0.3pc \Omega \subset\mathbb R^n\hskip 0.3pc \) będzie zbiorem otwartym.
Nośnikiem funkcji \( \hskip 0.3pc f:\,\Omega \to \mathbb R\hskip 0.3pc \) nazywamy zbiór
Funkcje \( \hskip 0.3pc f:\,\Omega \to \mathbb R\hskip 0.3pc \) nazywamy lokalnie całkowalną, jeśli jest całkowalna na dowolnym podzbiorze zwartym zbioru \( \hskip 0.3pc \Omega.\hskip 0.3pc \) Przestrzeń funkcji lokalnie całkowalnych na zbiore \( \hskip 0.3pc \Omega\hskip 0.3pc \) będziemy oznaczać symbolem \( \hskip 0.3pc L_{loc}^1(\Omega ).\hskip 0.3pc \) Zauważmy, że każda funkcja całkowalna, w szczególności funkcja ciągła o nośniku zwartym, jest lokalnie całkowalna.
Istotna dla naszych celów jest następująca własność całki Lebesgue'a, którą przypomnimy w formie uwagi.
dla dowolnego zbioru zwartego \( \hskip 0.3pc K\subset \Omega\hskip 0.3pc \), to \( \hskip 0.3pc f=g\hskip 0.3pc \) prawie wszędzie w \( \hskip 0.3pc \Omega.\hskip 0.3pc \)
Uwaga 1 jest natychmiastową konsekwencją znanego faktu, że jeśli \( \hskip 0.3pc \int_K fdx=0 \hskip 0.3pc \) dla każdego zbioru zwartego \( \hskip 0.3pc K \subset \Omega, \hskip 0.3pc \) to \( \hskip 0.3pc f=0 \hskip 0.3pc \) prawie wszędzie w \( \hskip 0.3pc \Omega. \hskip 0.3pc \)
Niech \( \hskip 0.3pc \Omega \subset\mathbb R^n\hskip 0.3pc \) będzie zbiorem otwartym. Niech \( \hskip 0.3pc D(\Omega)\hskip 0.3pc \) oznacza zbiór wszystkich funkcji \( \hskip 0.3pc \varphi :\Omega \to \mathbb R\hskip 0.3pc \) klasy \( \hskip 0.3pc C^{\infty}\hskip 0.3pc \) o zwartych nośnikach. Widać natychmiast, że \( \hskip 0.3pc D(\Omega)\hskip 0.3pc \) jest przestrzenią liniową. Zauważmy, że jeśli \( \hskip 0.3pc \varphi \in D(\Omega)\hskip 0.3pc \) to \( \hskip 0.3pc \varphi^{(n)} \in D(\Omega)\hskip 0.3pc \) dla dowolnego \( \hskip 0.3pc n\in \mathbb N\hskip 0.3pc \); ponadto, jeśli \( \hskip 0.3pc \psi \in C^{\infty}(\Omega),\hskip 0.3pc \) \( \varphi \in D(\Omega),\hskip 0.3pc \) to \( \hskip 0.3pc \varphi \psi \in D(\Omega).\hskip 0.3pc \)
Nietrudno sprawdzić, że funkcja \( \hskip 0.3pc \phi :\mathbb R\to \mathbb R\hskip 0.3pc \) dana wzorem
należy do \( \hskip 0.3pc D(\mathbb R).\hskip 0.3pc \) Jeśli \( \hskip 0.3pc x^2\hskip 0.3pc \) zastąpimy iloczynem skalarnym \( \hskip 0.3pc x\cdot x,\hskip 0.3pc \) \( x\in \mathbb R^n, \hskip 0.3pc \) otrzymamy funkcje z przestrzeni \( \hskip 0.3pc D(\mathbb R^n).\hskip 0.3pc \)
(i) Istnieje zbiór zwarty \( \hskip 0.3pc K\subset \Omega\hskip 0.3pc \) który zawiera nośniki wszystkich funkcji \( \hskip 0.3pc \varphi _i\hskip 0.3pc \), \( \hskip 0.3pc i \in \mathbb N\hskip 0.3pc \);
(ii) Dla dowolnego ciągu liczb \( \hskip 0.3pc k_1, \ldots ,k_n\in \{0,1, \ldots \}\hskip 0.3pc \)
Innymi słowami, ciąg \( \hskip 0.3pc \{\varphi_i\}\hskip 0.3pc \) jest zbieżny do funkcji \( \hskip 0.3pc \varphi,\hskip 0.3pc \) jeśli zarówno ciąg funkcji jak i ciągi ich pochodnych dowolnego rzędu są jednostajnie zbieżne odpowiednio do funkcji \( \hskip 0.3pc \varphi\hskip 0.3pc \) oraz jej stosownej pochodnej. Zauważmy, że jest to zbieżność bardzo silna. W dalszym ciągu tak zdefiniowaną zbieżność będziemy nazywać zbieżnością w \( \hskip 0.3pc D(\Omega).\hskip 0.3pc \)
Wygodnie jest przyjąć następujące oznaczenie na pochodne mieszane
gdzie \( \hskip 0.3pc k = (k_1, \ldots ,k_n)\hskip 0.3pc \), \( | k |=k_1+ \ldots +k_n\hskip 0.3pc \).
Zbiór wszystkich funkcjonałów liniowych i ciągłych (czyli zbiór wszystkich dystrybucji) na \( \hskip 0.3pc \Omega\hskip 0.3pc \) będziemy oznaczać symbolem \( \hskip 0.3pc D^*(\Omega)\hskip 0.3pc \). Warto podkreślić, że dystrybucje nie są określone w punktach zbioru \( \hskip 0.3pc \Omega\hskip 0.3pc \) lecz na elementach przestrzeni \( \hskip 0.3pc D(\Omega).\hskip 0.3pc \) Funkcje z przestrzeni \( \hskip 0.3pc D(\Omega)\hskip 0.3pc \) często nazywa się funkcjami próbnymi.
Mówimy, że dystrybucje \( \hskip 0.3pc L,T\in D^*(\Omega)\hskip 0.3pc \) są równe, jeśli \( \hskip 0.3pc \langle L,\varphi \rangle =\langle T, \varphi\rangle \hskip 0.3pc \) dla dowolnego \( \hskip 0.3pc \varphi \in D(\Omega).\hskip 0.3pc \) Mówimy, że dystrybucje \( \hskip 0.3pc L\hskip 0.3pc \) i \( \hskip 0.3pc T\hskip 0.3pc \) są równe w zbiorze otwartym \( \hskip 0.3pc U\subset \Omega\hskip 0.3pc \) jeśli \( \hskip 0.3pc \langle L,\varphi \rangle =\langle T, \varphi\rangle \hskip 0.3pc \) dla dowolnego \( \hskip 0.3pc \varphi \in D(\Omega)\hskip 0.3pc \) takiego, że \( \hskip 0.3pc{\rm supp}\, \varphi \subset U.\hskip 0.3pc \) W szczególności mówimy, że dystrybucja \( \hskip 0.3pc T\hskip 0.3pc \) zeruje się na zbiorze \( \hskip 0.3pc U,\hskip 0.3pc \) jeśli \( \hskip 0.3pc \langle T,\varphi \rangle =0\hskip 0.3pc \) dla dowolnego \( \hskip 0.3pc \varphi \in D(\Omega)\hskip 0.3pc \) takiego, że \( \hskip 0.3pc {\rm supp}\,\varphi \subset U\hskip 0.3pc \).
Podobnie jak nośnik funkcji można również wprowadzić pojęcie nośnika dystrybucji. Mianowicie, nośnikiem dystrybucji \( \hskip 0.3pc T\hskip 0.3pc \) nazywamy najmniejszy zbiór domknięty \( \hskip 0.3pc K\hskip 0.3pc \) taki, że \( \hskip 0.3pc T\hskip 0.3pc \) zeruje się na zbiorze \( \hskip 0.3pc \Omega \setminus K.\hskip 0.3pc \) Podobnie jak dla funkcji, nośnik dystrybucji będziemy oznaczać symbolem \( \hskip 0.3pc {\rm supp}\, T.\hskip 0.3pc \)
Możemy teraz formalnie zdefiniować wspomnianą poprzednio \( \hskip 0.3pc \delta\hskip 0.3pc \)-Diraca kładąc
lub ogólniej, dla dowolnego \( \hskip 0.3pc a \in \Omega\hskip 0.3pc \) możemy określić \( \hskip 0.3pc \delta_a\hskip 0.3pc \), kładąc
Zauważmy, że \( \hskip 0.3pc \delta_a\hskip 0.3pc \) jest dystrybucją na \( \hskip 0.3pc \Omega\hskip 0.3pc \). Istotnie, w oczywisty sposób \( \hskip 0.3pc \delta_a\hskip 0.3pc \) jest funkcjonałem liniowym na \( \hskip 0.3pc D(\Omega).\hskip 0.3pc \) Ponadto dla dowolnego ciągu \( \hskip 0.3pc \{\varphi_k\}\subset D(\Omega)\hskip 0.3pc \) zbieżngo do \( \hskip 0.3pc \varphi\hskip 0.3pc \) mamy
Stąd wynika natychmiast, że \( \hskip 0.3pc \delta_a\hskip 0.3pc \) jest funkcjonałem ciągłym, co należało pokazać.
Każdej funkcji ciągłej \( \hskip 0.3pc f:\Omega \to \mathbb R\hskip 0.3pc \) odpowiada dystrybucja \( \hskip 0.3pc T_f\hskip 0.3pc \) dana wzorem
Można pokazać, że jeśli dwie funkcje ciągłe wyznaczają tę samą dystrybucje to muszą być równe.
Co więcej, dla dowolnej funkcji lokalnie całkowalnej \( \hskip 0.3pc f\hskip 0.3pc \) całka po prawej stronie wzoru ( 6 ) istnieje, a formuła ( 6 ) określa funkcjonał liniowy na przestrzeni \( \hskip 0.3pc D(\Omega ).\hskip 0.3pc \) Ponadto, jeśli \( \hskip 0.3pc \varphi_k \to \varphi\hskip 0.3pc \) w sensie powyższej definicji, a \( \hskip 0.3pc K\hskip 0.3pc \) jest odpowiadającym (zgodnie z definicją 2) zbiorem zwartym, to
Ponieważ przy \( \hskip 0.3pc k\to \infty\hskip 0.3pc \) prawa strona ostatniej nieówności dąży do zera, funkcjonał określony wzorem ( 6 ) jest ciągły, czyli jest elementem przestrzeni \( \hskip 0.3pc D^*(\Omega).\hskip 0.3pc \) Zatem dla dowolnej funkcji lokalnie całkowalnej \( \hskip 0.3pc f,\hskip 0.3pc \) wzór ( 6 ) określa dystrybucje. Dystrybucje takie nazywany regularnymi. Przykładem dystrybucji regularnej jest dystrybucja generowana przez funkcje Heaviside'a
czyli dystrybucja \( \hskip 0.3pc T_{H}\hskip 0.3pc \) dana wzorem
Zwykle dystrybucje \( \hskip 0.3pc T_f\hskip 0.3pc \) generowaną przez funkcje \( \hskip 0.3pc f\hskip 0.3pc \) wzorem ( 6 ) oznacza się krótko również symbolem \( \hskip 0.3pc f.\hskip 0.3pc \) Oznaczenie takie upraszcza zapis, a na ogół nie prowadzi do nieporozumień. W zależności od sytuacji symbol \( \hskip 0.3pc f\hskip 0.3pc \) będzie oznaczać funkcje lokalnie całkowalną albo odpowiadającą jej dystrybucje.
W niniejszym tekście będziemy używać obu oznaczeń. Kiedy wymagać tego będzie przejrzystość wykładu, dystrybucje generowaną przez funkcje \( \hskip 0.3pc f\hskip 0.3pc \) będziemy oznaczać symbolem \( \hskip 0.3pc T_f.\hskip 0.3pc \)
Ciągłe funkcjonały liniowe na przestrzeni \( \hskip 0.3pc D(\Omega ),\hskip 0.3pc \) które nie mają reprezentacji całkowej postaci ( 6 ) (tzn. nie są generowane przez funkcje lokalnie całkowalne) nazywamy dystrybucjami nieregularnymi. Przykładem dystrybucji nieregularnej jest wspomniana wyżej \( \hskip 0.3pc \delta\hskip 0.3pc \)-Diraca.
Dystrybucja regularna \( \hskip 0.3pc T_f=0\hskip 0.3pc \) wtedy i tylko wtedy, gdy \( \hskip 0.3pc f=0\hskip 0.3pc \) prawie wszędzie (względem miary Lebesgue'a). Poniżej pokażemy ten fakt przy dodatkowym założeniu, że \( \hskip 0.3pc f\hskip 0.3pc \) jest rozwijalna w szereg Fouriera.
ZAŁOŻENIA:
Niech \( \hskip 0.3pc f:\Omega \to \mathbb R,\hskip 0.3pc \) \( \hskip 0.3pc \Omega \subset \mathbb R^n,\hskip 0.3pc \) będzie funkcją lokalnie całkowalną, rozwijalną w szereg Fouriera.TEZA:
Wówczas dystrybucja \( \hskip 0.3pc T_f\hskip 0.3pc \) zeruje się na \( \hskip 0.3pc \Omega\hskip 0.3pc \) wtedy i tylko wtedy, gdy \( \hskip 0.3pc f=0\hskip 0.3pc \) prawie wszędzie w \( \hskip 0.3pc \Omega.\hskip 0.3pc \)DOWÓD:
Jeśli \( \hskip 0.3pc f=0\hskip 0.3pc \) prawie wszędzie w \( \hskip 0.3pc \Omega\hskip 0.3pc \) to dla dowolnego \( \hskip 0.3pc \varphi \in D (\Omega)\hskip 0.3pc \)co oznacza, że \( \hskip 0.3pc T_f=0.\hskip 0.3pc \)
Przypuśćmy teraz, że \( \hskip 0.3pc T_f=0\hskip 0.3pc \). Niech \( \hskip 0.3pc x_0\in \Omega\hskip 0.3pc \) i niech \( \hskip 0.3pc \epsilon >0.\hskip 0.3pc \) Połóżmy
gdzie \( \hskip 0.3pc C_{\epsilon }\hskip 0.3pc \) jest tak dobrane aby
Dla dowolnego wielowskaźnika \( \hskip 0.3pc k=(k_1,\ldots ,k_n)\hskip 0.3pc \) połóżmy
gdzie \( \hskip 0.3pc i\hskip 0.3pc \) oznacza jednostkę urojoną, a \( \hskip 0.3pc k\cdot x =\displaystyle \sum_{i=1}^nk_ix_i.\hskip 0.3pc \)
Załóżmy, że \( \hskip 0.3pc K(x_0,\epsilon)\subset \Omega.\hskip 0.3pc \) Oczywiście \( \hskip 0.3pc \psi _k \in D(\Omega).\hskip 0.3pc \) Stąd i z faktu, że \( \hskip 0.3pc T_f=0,\hskip 0.3pc \) mamy
Z ostatniego wzoru wynika, że wszystkie współczynniki rozwinięcia Fouriera funkcji \( \hskip 0.3pc f(x)\omega_{\epsilon }(x-x_0)\hskip 0.3pc \) względem układu funkcji \( \hskip 0.3pc \{ e^{ik\cdot x/\epsilon}: k\in {\mathbb N}_0^n \}\hskip 0.3pc \) \( (\hskip 0.1pc \mathbb N_0=\mathbb N\cup\{0\})\hskip 0.3pc \) w kuli \( \hskip 0.3pc K(x_0,\epsilon)\hskip 0.3pc \) są równe zeru.
Zatem \( \hskip 0.3pc f=0\hskip 0.3pc \) w \( \hskip 0.3pc K(x_0,\epsilon ).\hskip 0.3pc \) Ponieważ \( \hskip 0.3pc x_0\hskip 0.3pc \) jest punktem dowolnym w \( \hskip 0.3pc \Omega,\hskip 0.3pc \) dowód jest zakończony.